package com.jml.mapreduce.自定义分区规则;

import com.jml.mapreduce.自定义序列化.FlowBean;
import org.apache.hadoop.mapreduce.Partitioner;
import org.apache.hadoop.io.Text;
/**
 *需求：在自定义序列化中案例中，将统计结果按照手机归属地不同省份输出到不同文件中（分区）
 *  手机号136、137、138、139开头都分别放到一个独立的4个文件中，其他开头的放到一个文件中。
 */
public class MyPartitioner  extends Partitioner<Text, FlowBean> {

        @Override
        public int getPartition(Text key, FlowBean value, int numPartitions) {
            // 1 获取电话号码的前三位，key就是Map中的Key
            String preNum = key.toString().substring(0, 3);
            int partition = 4;
            // 2 判断是哪个省
            if ("136".equals(preNum)) {
                partition = 0;
            }else if ("137".equals(preNum)) {
                partition = 1;
            }else if ("138".equals(preNum)) {
                partition = 2;
            }else if ("139".equals(preNum)) {
                partition = 3;
            }
            return partition;
        }
}
